﻿using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
using Tesseract;

namespace PDF2TXT.Start
{
    public class OcrHelper
    {
        public string RecognizeTextFromImage(string imagePath)
        {
            // 初始化Tesseract引擎            
            using (var engine = new TesseractEngine(@"./tessdata", "chi_sim", EngineMode.Default))
            {
                // 加载图片
                using (var img = Pix.LoadFromFile(imagePath))
                {
                    // 识别图片中的文字
                    using (var page = engine.Process(img))
                    {
                        // 获取识别结果
                        string result = page.GetText();

                        // 返回识别的文字
                        return result;
                    }
                }
            }
        }
    }
}
